02. 超参数寻优介绍




让我们来看看我们如何使用SageMaker来改善我们的波士顿住房模型。首先,我们将提醒自己如何使用SageMaker训练模型。

我们在 波士顿房价 预测中使用的 xgboost 中设定的参数如上图所示。

从本质上讲,调整模型意味着训练一组模型,每个模型都有不同的超参数,然后选择性能最佳的模型。所以 SageMaker 的自动调参实际上是在我们设置的范围内,寻找最优解。

在说这个设置之前,我们先来看看 CloudWatch服务,这是保存多个模型结果的位置,具体的查找位置如下所示:

  • Training Jobs 里找到 这个 模型的 Name

  • 点击进去之后,拉下 Monitor,点击 View logs

  • 这里会显示显示所有model printout 的 rmse

当然,我们仍然需要描述超参数调整的两个不同方面:

1)什么是群模型?换句话说,我们应该训练多少种不同的模型?

2)哪种型号是最佳型号?换句话说,我们应该使用什么样的度量标准来区分一个模型相对于另一个模型的执行情况。